AI 史话_草庐IT

【RPA】智能自动化的未来：AI + RPA

伴随着人工智能（AI）技术的迅猛进步，机器人流程自动化（RPA）正在经历一场翻天覆地的变革。AI为RPA注入了新的活力，尤其在处理复杂任务和制定决策方面。通过融合自然语言处理（NLP）、机器学习、图像识别等AI技术，RPA得以更精准地解读、分析并应对各种业务场景。那么，究竟什么是RPA呢？RPARPA（RoboticProcessAutomation机器人流程自动化），作为一种自动化技术，其目标在于运用软件机器人（亦称为机器人工作者或机器人助手）对计算机上进行的重复性、规则性任务进行模拟和自动执行。例如，RPA软件机器人具备模仿人类用户操作的能力，如数据输入与处理、应用程序解析、响应生成以及与

好书推荐丨AI绘画全面精通：软件平台+脚本文案+设计制作+案例实战

文章目录写在前面AI绘画推荐图书图书简介本书特色作者简介推荐理由粉丝福利写在后面写在前面本期博主给大家带来了一本全新出版的AI绘画类书籍，《AI绘画全面精通：软件平台+脚本文案+设计制作+案例实战》，对人工智能感兴趣的小伙伴快来看看吧！AI绘画AI绘画（ArtificialIntelligencePainting）是指运用人工智能技术进行艺术创作的一种新型绘画形式。它结合了机器学习、深度学习尤其是生成对抗网络（GANs）、卷积神经网络（CNNs）等先进技术，通过训练模型来理解和模仿人类艺术家的创作风格、技巧和审美偏好。在AI绘画过程中，算法首先会学习大量的艺术作品数据集，包括各种流派、画家的画

IT资讯——全速推进“AI+鸿蒙”战略布局！

文章目录每日一句正能量前言坚持长期研发投入全速推进“AI+鸿蒙”战略人才战略新章落地持续加码核心技术生态建设后记每日一句正能量人总要咽下一些委屈，然后一字不提的擦干眼泪往前走，没有人能像白纸一样没有故事，成长的代价就是失去原来的样子其实，早晚有一天你会明白，人除了生死其余的只是擦伤罢了。心底的痛写在脸上，就叫沧桑。心底的伤写在眼里，就叫故事。人生路长，大度何妨心有故事，脸无沧桑。前言2月7日，拓维信息2024全国研发人才千人招聘计划启动仪式，以现场直播的方式在长沙盛大举行。在中国科技创新由跟随转向并行、乃至领跑的关键当口，拓维信息作为一家长期深耕IT国产化的上市科技企业，率先以一场大规模“揽才

OPPO打响AI手机第一枪

明敏发自凹非寺量子位|公众号QbitAI2024开年，AI趋势依旧高歌猛进。一边，Sora爆火成为现象级AIGC应用，带动AI再度成为春节后全民热议的第一话题。另一边，手机厂商开始大举AllinAI，“放弃传统智能手机”、“开启AI手机时代”的声音一浪高过一浪。行业内外都不再犹豫，影响更为深远的AI应用落地浪潮正在酝酿。在这其中，手机是最容易让所有人产生感知的落地领域。它是连接大众的“第一屏幕”，是智能体落地最直接的终端……厂商们深谙此理，在开年2个月内大动作频频。不过各家思路不尽相同。有人彻底转换赛道，有人没有放话“AllinAI”、但里里外外已都是AI……先声夺人的是OPPOOPPO一直都

最新技术解析：Open ai新推出了视频生成工具Sora

文章目录概要技术名词解释技术细节小结概要OpenAI的GPT大模型最近几年发展迅猛，起初我还是观望或者看客心态，毕竟新鲜事物太多。直到最近半年两个技术改变了我的看法，之前推出的诸如人工智能图片生成器（idjourney、DALL-E2、Stableboost、NovelAI和StableDiffusion等）以及本月发布的视频生成器Sora,给我带来了比较大的触动，让我开始正视OpenApi的前瞻性发展以及未来对社会生产力的巨大变革。后面我会找时间写一篇人工智能图片生成器的技术解析。技术名词解释Sora地址：VideogenerationmodelsasworldsimulatorsOpenA

【AIGC-AI人像生成系列-1】PhotoMaker：定制逼真的人体照片

目录一.项目概述与贡献a)项目概述b)主要贡献二. 方法详解a)PhotoMaker和ID导向的数据构建管道的概览 PhotoMaker： ID导向的数据构建管道：b)方法详细解读堆叠ID嵌入（StackedIDEmbedding）：2.ID导向的数据构建管道：3.训练过程：4.推理（Inference）：5.应用和灵活性：6.实验和评估：三. 重新语境化结果四.将艺术品/老照片中的人物带入现实结果五.风格化六.改变年龄或性别结果七.身份混合八.比较结果九.论文关注公众号【AI杰克王】继FaceChain,Easyphoto等AI人像工作,PhotoMaker横空出世。PhotoMaker通过

Sora：AI视频模型的革新者

随着人工智能技术的飞速发展，AI视频模型已成为科技领域的新热点。在这个浪潮中，OpenAI推出的首个AI视频模型Sora，以其卓越的性能和前瞻性的技术，引领着AI视频领域的创新发展。本文将从Sora的技术特点、应用场景以及对未来创作方式的深远影响三个方面进行探讨。一、Sora的技术特点 1.高度智能的图像识别与生成能力 Sora采用了先进的深度学习技术和神经网络结构，通过对海量视频数据的训练，实现了对视频内容的高度理解和智能生成。这使得Sora能够根据用户的输入和需求，自动生成高质量的视频内容。 2.强大的语音识别与生成

要说最近一周的头条热搜，非Sora莫属！Sora的诞生，再一次引发了人们对AI人工智能以及AIGC的关注。对第一次听说Sora的人，可能会好奇，大家都在说的Sora是什么？Sora是什么软件？Sora，是OpenAI继ChatGPT之后，推出的又一重磅力作，它是一个文本到视频模型（即文本生成视频），可以根据用户输入的描述性提示快速生成视频，并及时向前或向后扩展现有视频。Sora的核心功能在于其能够理解并转化文本指令为动态视频内容。用户只需提供简单的文本描述，Sora就能生成具有丰富细节和连贯性的视频。这一过程涉及到复杂的图像生成和视频编辑技术，Sora能够在几秒钟内完成，支持生成长达一分钟的视

Amazon Generative AI | 基于 Amazon 扩散模型原理的代码实践之采样篇

以前通过论文介绍Amazon生成式AI和大语言模型（LLMs）的主要原理之外，在代码实践环节主要还是局限于是引入预训练模型、在预训练模型基础上做微调、使用API等等。很多开发人员觉得还不过瘾，希望内容可以更加深入。因此，本文将讲解基于扩散模型原理的代码实践，将尝试用代码完整从底层开始洞悉扩散模型（DiffusionModels）的工作原理，而不再仅仅止步于引入预训练模型或使用API完成工作。1、扩散模型系列内容概述基于扩散模型（DiffusionModels）的大模型，例如：StableDiffusion、Midjourney、DALL-E等能够仅通过提示词（Prompt）就能够生成图像。我们

【AI】推理系统和推理引擎的整体架构

本文主要是对B站Up主ZOMI酱推理系统系列视频的理解，可以认为是重点笔记。一、深度学习模型的全生命周期相信很多人和我一样，刚看到深度学习模型中的推理系统或推理引擎时是一头雾水，因为学习DL时通常关注于模型的设计和训练。下图是深度学习模型的全生命周期图，主要分为两大类任务，训练任务和推理任务。训练任务：通常需要执行数小时、数天，一般配置较大的batchsize以实现较大的吞吐量，训练模型直到指定的准确度或错误率。推理任务：执行7x24小时服务，此时模型已稳定无需训练，服务于真实数据进行推理预测，一般batchsize较小。训练过程通过设计合适的AI模型以及损失函数、优化算法等，前向传播并计算损